冠状病毒大流行的严重程度需要有效的行政决定。在印度超过4万人的人屈服于Covid-19,拥有超过3亿卢比的确认案例,仍然计数。合理的第三波的威胁继续困扰数百万。在这种不断变化的病毒动态中,预测性建模方法可以用作整体工具。大流行进一步引发了一个前所未有的社交媒体使用。本文旨在提出一种利用社交媒体,特别推特的方法来预测与Covid-19案件相关的即将发生的情景。在这项研究中,我们寻求了解Covid-19相关推文的潮流如何表明案件的增加。这种前瞻性分析可用于帮助管理员及时资源分配,以减少损坏的严重程度。使用Word Embeddings来捕获推文的语义含义,我们识别大量尺寸(SDS).Or方法,预测患情况的上升时间为15天,30天,R2分别为0.80和0.62。最后,我们解释了SDS的主题效用。
translated by 谷歌翻译
数据以难以想象的速度扩展,并且随着这种发展,有责任质量的数据。数据质量指的是信息存在的相关性,并有助于在特定组织中的决策和规划等各种操作。大多数数据质量是根据ad-hoc测量的,因此没有开发的概念提供任何实际应用。目前的实证研究是为制定了一个具体的自动化数据质量平台,以评估传入数据集的质量,并生成质量标签,分数和全面报告。我们利用来自HealthData.gov,Opendata.nhs和人口统计和健康调查(DHS)程序的各种数据集来观察质量分数的变化,并使用主成分分析(PCA)制定标签。目前的实证研究结果揭示了一种包括九种质量成分的度量,即来源,数据集特征,均匀性,元数据耦合,丢失小区的百分比和重复的行,数据的歪曲,分类列的不一致性比率和之间的相关性这些属性。该研究还提供了一种说明性的突变测试方法的公制的研究和验证。该研究研究提供了一个自动平台,该平台占据了传入的数据集和元数据,以提供DQ分数,报告和标签。本研究的结果对于数据科学家来说是有用的,因为这种质量标签的价值将在部署他/她各自的实际应用程序之前灌输信心。
translated by 谷歌翻译
Covid-19疫苗是我们最好的赌注,用于减轻大流行的持续冲击。但是,疫苗也预计将是有限的资源。最佳分配策略,特别是在具有访问不公平的国家和热点的时间分离,可能是停留疾病传播的有效方式。我们通过提出一种新的管道VACSIM来实现这个问题,将深度加强学习模型延装到用于优化Covid-19疫苗的分布的上下文的匪徒方法中。虽然加强学习模型建议了更好的行动和奖励,但上下文匪徒允许在现实世界场景中每天到日常实施的在线修改。我们评估此框架,防止与印度五个不同状态的Covid-19案例发生比例分配疫苗的天真分配方法(Assam,Delhi,Jharkhand,Maharashtra和Nagaland),并展示高达9039潜力的潜在感染,并增加了显着增加在通过VacSim方法的45天内限制差异的疗效。我们的型号和平台对印度所有国家和潜在的全球范围内都是可扩张的。我们还提出了新的评估策略,包括标准的基于区间模型的预测和对我们模型的因果关系评估。由于所有模型都携带可能需要在各种情况下进行测试的假设,因此我们开源我们的模型Vackim并贡献了与Openai健身房兼容的新型加固学习环境,以使其在全球的现实世界应用中可扩展。 (http://vacsim.tavlab.iiitd.edu.in:8000/)。
translated by 谷歌翻译
有效的有丝分裂定位是决定肿瘤预后和成绩的关键先驱任务。由于固有的域偏见,通过深度学习的图像分析通过深度学习图像分析的自动化检测通常会失败。本文提出了一个用于有丝分裂检测的域均质器,该域均质器试图通过输入图像的对抗重建来减轻组织学图像的领域差异。拟议的均质器基于U-NET架构,可以有效地减少组织学成像数据常见的域差异。我们通过观察预处理图像之间的域差异来证明我们的域均质器的有效性。使用此均匀剂,以及随后的视网膜网络检测器,我们能够以检测到的有丝分裂数字的平均精度来超越2021 MIDOG挑战的基准。
translated by 谷歌翻译
深度学习研究引起了广泛的兴趣,导致出现了各种各样的技术创新和应用。由于深度学习研究的很大比例关注基于视觉的应用,因此存在使用其中一些技术来实现低功率便携式医疗保健诊断支持解决方案的潜力。在本文中,我们提出了一个基于硬件的嵌入式软件实施显微镜诊断支持系统,用于POC案例研究:(a)厚血液涂片中的疟疾,(b)痰液样品中的结核病,以及(c)(c)粪便中的肠道寄生虫感染样品。我们使用基于挤压网络的模型来减少网络大小和计算时间。我们还利用训练有素的量化技术来进一步减少学习模型的记忆足迹。这使基于显微镜的病原体检测将实验室专家级别的精度分类为独立的嵌入式硬件平台。与基于CPU的常规实施相比,提议的实施功率更高6倍,并且推理时间为$ \ sim $ 3 ms/示例。
translated by 谷歌翻译
肺癌治疗中有针对性疗法的标准诊断程序涉及组织学亚型和随后检测关键驱动因素突变,例如EGFR。即使分子分析可以发现驱动器突变,但该过程通常很昂贵且耗时。深度学习的图像分析为直接从整个幻灯片图像(WSIS)直接发现驱动器突变提供了一种更经济的替代方法。在这项工作中,我们使用具有弱监督的自定义深度学习管道来鉴定苏木精和曙红染色的WSI的EGFR突变的形态相关性,此外还可以检测到肿瘤和组织学亚型。我们通过对两个肺癌数据集进行严格的实验和消融研究来证明管道的有效性-TCGA和来自印度的私人数据集。通过管道,我们在肿瘤检测下达到了曲线(AUC)的平均面积(AUC),在TCGA数据集上的腺癌和鳞状细胞癌之间的组织学亚型为0.942。对于EGFR检测,我们在TCGA数据集上的平均AUC为0.864,印度数据集的平均AUC为0.783。我们的关键学习点包括以下内容。首先,如果要在目标数据集中微调特征提取器,则使用对组织学训练的特征提取器层没有特别的优势。其次,选择具有较高细胞的斑块,大概是捕获肿瘤区域,并不总是有帮助的,因为疾病类别的迹象可能存在于肿瘤 - 肿瘤的基质中。
translated by 谷歌翻译
准确且具有成本效益的水体映射对环境的理解和导航具有巨大的意义。但是,我们从此类环境特征中获得的信息数量和质量受到各种因素的限制,包括成本,时间,安全性以及现有数据收集技术的功能。水深度的测量是此类映射的重要组成部分,尤其是在可以提供导航风险或具有重要生态功能的浅层地点。例如,由于暴风雨和侵蚀,这些位置的侵蚀和沉积会导致需要重复测量的快速变化。在本文中,我们描述了使用侧扫声纳的低成本,弹性,无人自主的表面车辆用于测深的数据收集。我们讨论了用于收集导航,控制和测深数据的设备和传感器的适应,还概述了车辆设置。这款自动表面车辆已用于从印度孟买的Powai湖收集测深。
translated by 谷歌翻译
发现表面电阻率的传统调查方法是耗时的和劳动量的。很少有研究重点是使用遥感数据和深度学习技术找到电阻率/电导率。在这一工作中,我们通过应用各种深度学习方法评估了表面电阻率和合成孔径雷达(SAR)之间的相关性,并在美国Coso地热区域中测试了我们的假设。为了检测电阻率,使用了UAVSAR获得的L波段全偏光SAR数据,并将MT(MagnEtoteltolarics)反向电阻率数据用作地面真相。我们进行了实验,以比较各种深度学习体系结构,并建议使用双输入UNET(DI-UNET)体系结构。 Di-Unet使用深度学习架构使用完整的极化SAR数据来预测电阻率,并承诺对传统方法进行快速调查。我们提出的方法实现了从SAR数据中映射MT电阻率的结果。
translated by 谷歌翻译
尽管U-NET体系结构已广泛用于分割医学图像,但我们解决了这项工作中的两个缺点。首先,当分割目标区域的形状和尺寸显着变化时,香草U-NET的精度会降低。即使U-NET已经具有在各种尺度上分析特征的能力,我们建议在U-NET编码器的每个卷积模块中明确添加多尺度特征图,以改善组织学图像的分割。其次,当监督学习的注释嘈杂或不完整时,U-NET模型的准确性也会受到影响。由于人类专家在非常精确,准确地识别和描述所有特定病理的所有实例的固有困难,因此可能发生这种情况。我们通过引入辅助信心图来应对这一挑战,该辅助信心图较少强调给定目标区域的边界。此外,我们利用深网的引导属性智能地解决了丢失的注释问题。在我们对乳腺癌淋巴结私有数据集的实验中,主要任务是分割生发中心和窦性组织细胞增多症,我们观察到了基于两个提出的增强的U-NET基线的显着改善。
translated by 谷歌翻译
我们介绍了Dragon,这是一种开源,快速和可解释的硬件仿真和优化工具链,使硬件架构师能够模拟硬件设计,并优化硬件设计以有效地执行工作负载。龙工具链提供以下工具:硬件模型生成器(DGEN),硬件模拟器(DSIM)和硬件优化器(DOPT)。 DSIM提供了所述硬件上的运行算法(表示为数据流图)的模拟。 DGEN用用户输入体系结构/技术(以自定义描述语言表示)详细描述了硬件。来自模拟的梯度下降的新方法使我们优化了硬件模型(为改进技术参数和设计参数的指示),由DOPT提供。 Dragon Framework(DSIM)比以前可用的模拟作品快得多,这是通过性能优先编写惯例,用于常见计算操作的数学公式,以避免避免自行车准确的模拟步骤,有效的映射算法和数据结构表示形式用于硬件状态。 Dragon Framework(DOPT)为AI和非AI工作负载生成性能优化的架构,并为100X-1000X更好的未来计算系统提供技术改进方向。
translated by 谷歌翻译